確率と統計：不確実性の科学：統計量を確率変数として見る：標本分布

統計的推測では、個々のデータ点の観察から始まり、標本系列の関数的写像 $Y = h(X_1, X_2, \dots, X_n)$ として定義される**統計量**の分析へと移行します。元となる標本が確率変数で構成されているため、統計量自体も確率変数となり、その確率法則は**標本分布**と呼ばれます。

統計量とは写像である

統計量は正式には関数 $h: \mathbb{R}^n \to \mathbb{R}$ として定義されます。統計量が集合 $B$ に属する確率は、前像を使って定義します：

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

i.i.d. の基礎

独立かつ同一分布（i.i.d.）に従う確率変数の標本について、特定の標本点 $(x_1, \dots, x_n)$ に対する同時確率は、各変数の周辺確率の積、すなわち $p(x_1)p(x_2)\dots p(x_n)$ になります。この積は、統計量が特定の値を取る確率を計算する際の各点の重みとなります。

例 4.1.1：幾何平均

離散的な母集団において、$p_X(1) = 1/2$、$p_X(2) = 1/4$、$p_X(3) = 1/4$ とします。サイズ $n=2$（$X_1, X_2$）の標本を抽出し、統計量として幾何平均 $Y_2 = (X_1 X_2)^{1/2}$ を定義します。

$Y_2$ の分布を求めるために、すべての可能なペア $(X_1, X_2)$ を9通り列挙し、それぞれの同時確率と得られる $Y_2$ を計算します：

ペア $(x_1, x_2)$	確率 $P(x_1)P(x_2)$	$Y = \sqrt{x_1 x_2}$
(1, 1)	1/4	1.000
(1, 2), (2, 1)	1/8 + 1/8 = 1/4	1.414
(1, 3), (3, 1)	1/8 + 1/8 = 1/4	1.732
(2, 2)	1/16	2.000
(2, 3), (3, 2)	1/16 + 1/16 = 1/8	2.449
(3, 3)	1/16	3.000

正確分布と漸近分布

中心極限定理（CLT）のような極限定理に進む前に、「正確分布」を習得することが必要です。これは、小さな有限の $n$ に対して、統計量の具体的な確率質量関数または確率密度関数を計算することを意味します。解析的に扱いにくくなった場合には、**モンテカルロ近似**などの数値シミュレーションに頼ります。

🎯 核心原則

標本分布とは、あるi.i.d.系列の関数に対応する確率変数の分布です。それは、原始データと科学的推論との間の橋渡しです。

問題 1

例 4.1.1 の分布から独立同分布に従う $X_1, X_2, X_3$ があるとします。幾何平均 $Y_3 = (X_1 X_2 X_3)^{1/3}$ が 1 になる確率はいくらですか？

$1/2$

$1/4$

$1/8$

$1/27$

問題 2

公平な6面サイコロを $n = 2$ 回独立して振ったとき、標本平均がちょうど 1.5 になる確率はどれですか？

$1/36$

$2/36$

$3/36$

$1/6$

問題 3

0 が $p$、1 が $1 - p$ の割合で入った壺から、$n=2$ で復元抽出する標本を取ります。標本平均が 0.5 になる確率はいくらですか？

$p^2$

$(1-p)^2$

$2p(1-p)$

$p(1-p)$

問題 4

統計量 $h$ が特定の区間 $B$ に入るようなすべての標本点 $(x_1, \dots, x_n)$ の集合を表す数学的構造はどれですか？

同時密度関数

前像 $h^{-1}B$

モーメント生成関数

期待値写像

問題 5

モンテカルロ法で積分 $\int_{-\infty}^{\infty} \cos^2(x)e^{-x^2/2} dx$ を近似する際に、計算を簡略化するためにどの分布からサンプリングすべきですか？

一様分布(0, 1)

ポアソン分布(1)

標準正規分布 $N(0, 1)$

指数分布(1)